图像数据集的大小一直在稳步增长,损害了大规模3D重建方法的可行性和效率。在本文中,提出了一种新颖的方法,用于将多视图立体声(MVS)算法扩展到任意大量图像集合。具体而言,重建整个城市的3D模型的问题是针对目标的,从一组配备了多个高分辨率摄像头的移动车辆收购的视频开始。最初,提出的方法利用了姿势和几何形状的大约均匀分布,并构建了一组重叠的簇。然后,为每个群集制定了整数线性编程(ILP)问题,以选择一个最佳的视图子集,以保证可见性和可匹配性。最后,分别计算并合并每个集群的本地点云。由于聚类独立于成对可见性信息,因此所提出的算法运行速度比现有文献更快,并且可以进行大规模的并行化。讨论了对城市数据的广泛测试,以显示该方法的有效性和可扩展性。
translated by 谷歌翻译